WordSmith Tools

 

WordSmith Tools是最著名最强大的语料处理工具之一,主要具备三大功能:检索、单词列表、主题词统计.

检索(Concord)功能

检索功能是WordSmith最主要、最常用的功能,其 主要作用是查询和统计某个或某些词汇或短语在指定文本中出现的频数。由于口语或书面语输出是第二语言学习者语言能力的直接反映,因此,将学习者的书面语输出转写为电子文本,或将学习者的第二语言口语转写成电子文本格式之后,对所得文本中的有关词汇或短语进行频率统计,并将所得的数据与本族语者的语言输出进行对照,可以揭示第二语言学习者目标语能力的特点及发展规律。无论是在计算机辅助错误分析中还是在中介语对比分析中,检索都是第二语言文本分析中常见的方法。WordSmith可以进行三种检索:简单检索、高级检索和基于文件的检索(file2basedconcordancing)。简单检索的目的是在文本中检索某个或某些词汇或短语的出现频率,不考虑检索词的语境,主要适用于对少量词语进行检索。高级检索指在检索过程中对检索词所出现的语境加以进一步的设定,目的是查找满足一定语境条件的检索词。基于文件的检索需要研究者自行编制一个文本文 件,在所编制的文本文件中列出多个需要检索的词。这种检索方法适用于检索语料中多个词汇或短语。由于每一个检索行后都标明了该行文字出自于哪一个文本,这种方法十分方便批量文本分析。

单词列表(WordList)功能

WordList功能主要用来创建语料库中词汇使用频 率列表,确定哪些词汇或词块(clusters)是最常用的,而另外哪些则相对比较少用。WordList的主要目的在于:①研究语料库中的词汇类型;②确定语料库中的常见词块;③比较不同文本中特定词汇的使用频率。

主题词(KeyWords)功能

主题词是研究文本内容和文本语言特征差异的重要手段,主题词指频率显著高于或显著低于参照语料库中对应词的频率的哪些词汇。由于研究目的和研究者语料库占有情况的不同,参照语料库自然也不一样。通过主题词功能,我们可以把一个语料库(即观察语料库)中的词频与参照语料库中的对应词的词频进行比较,从而确定这个语料库与参照语料库之间在词频方面是否存在显著差异,为研究语域差异、作家写作风格差异、学习者语言与本族语使用者语言间的差异等提供数据。

 

 

ҳģ